PDF Extractor SDK för Windows-programutvecklare: PDF till Text, PDF till XML, Bilder från PDF, Läs PDF-information, PDF till CSV för Excel.
Bytescout PDF Extractor SDK kan konvertera PDF till text, PDF till XML, PDF till CSV, extrahera bilder från PDF, extrahera information om PDF-filer i. NET och ActiveX-gränssnitt utan ytterligare programvara krävs.
fördelar:
konverterar PDF till vanlig text (och kan följa kolumner om du konverterar en tidning i PDF-format) - inklusive osynlig textutvinning;
konverterar tabeller i PDF till Excel (CSV) genom att läsa celler från given rektangel;
konverterar tabeller i PDF till XML-filer;
utdrag PDF-metadata (titel, författare, beskrivning) och få annan information om filen (antal sidor, krypterad eller ej);
extraherar inbäddade bilder från PDF-dokument (i ASP.NET, VB.NET, C #, VB6 och VBScript);
DocumentMerger och DocumentSplitter-gränssnitt och klasser för att slå samman och dela PDF-dokument.
kräver inte att Adobe Reader eller någon annan PDF-läsare programvara ska installeras
tillhandahåller. NET och ActiveX-gränssnitt;
gjord med 100% hanterad C # -kod.
Vad är nytt i den här utgåvan:
Version 9.0.0.3079: Tillagd filtrering av extraherat innehåll med typsnitt, teckensnittstorlek och färg.
Uppdaterad OCR-motor till den senaste versionen. Uppdatera språkfiler från mappen "tessdata".
Förbättrad textutvinning, linjer som grupperar i tabelldata, prestanda, XFA-former, extrakt, TableDetector, fasta PDF-analysproblem.
Vad är nytt i version 8.7.0.2980:
Tillagd filtrering av extraherat innehåll med typsnitt, teckensnittstorlek och färg.
Uppdaterad OCR-motor till den senaste versionen. Uppdatera språkfiler från mappen "tessdata".
Förbättrad textutvinning, linjer som grupperar i tabelldata, prestanda, XFA-former, extrakt, TableDetector, fasta PDF-analysproblem.
Vad är nytt i version 8.6.0.2911:
Tillagd filtrering av extraherat innehåll med typsnitt, teckensnittstorlek och färg.
Uppdaterad OCR-motor till den senaste versionen. Uppdatera språkfiler från mappen "tessdata".
Förbättrad textutvinning, linjer som grupperar i tabeldata, prestanda, XFA-formulärutvinning, TableDetector, fasta PDF-analysproblem.
Vad är nytt i version 8.2.0.2699:
Version 8.2.0.2699 kan innehålla ospecificerade uppdateringar, förbättringar eller buggfixar.
Vad är nytt i version 8.0.0.2528:
Vad är nytt i version 7.0.0.2474:
Version 7.0.0.2474:
- lagt till en ny dokumentspridare för DocumentPrinter så att du kan skriva ut PDF-dokument tyst (utan användardialoger)
- lagt till en ny JSONExtractor-klass
- Tillagd överstyrning för DocumentSplitter.Split () -metoden som gör det möjligt att ange utmatningsmappen för genererade filer
- Fixat multi-threading bug i DocumentSplitter
- tableDetector respekterar nu utvinningsområdet enligt SetExtractionArea () -metoden
- Nya egenskaper i extraktionsklasser: ExtractionColumns - innehåller koordinater för detekterade kolumner; CustomExtractionColumns - tillåter att kolumnavkänningen ignoreras
- GetPageRect * -metoderna tog inte hänsyn till sidrotationen.
Fixat fel i installationsprogrammet som orsakade vissa filer från tidigare installation störde uppdateringar - omarbetade registreringskontrollen. Nu kommer biblioteket inte att kasta ett undantag, men arbetar i demoläge om du missat eller matar in felaktigt RegistrationName och RegistrationKey
- PDF-multitool: Lades till den senaste dokumentlistan till "Öppna PDF-dokument" -knappen
- PDF Multitool: Urvalet kan ändras nu
- PDF Multitool: Added Extract JSON-funktionen
- PDF-multitool: Förbättrat användargränssnitt för tabelldetektor
- PDF Multitool: Mycket förbättrad typsnittskvalitet
- PDF Multitool: Added debug-alternativ "Visa upptäckta extraktionskolumner" i snabbmenyn för att visa de upptäckta kolumnerna på den aktuella sidan. Blir synlig först efter att ha kört någon extraktion mot den aktuella visade sidan
- PDF Multitool: Fixed font rendering problem på 32-bitars Windows
- Andra mindre förbättringar och buggfixar
Vad är nytt i version 6.30.0.2421:
Version 6.30.0.2421:
- Tillagd TextComparer-verktygsklass (finns endast i .NET 4.0-enheter), så att du kan jämföra text i två PDF-dokument och generera rapport.
- Förbättrat stöd för ICC-färgprofiler.
- Imporved hantering av inbäddade teckensnitt.
- Förbättrad bilagaExtractor.
- Fast XMLExtractor.SaveXMLToStream () -metoden.
- Dubbelt extraherad textöverföring när du använder OCRCacheMode.WholePage-alternativet.
- Andra buggfixar och förbättringar.
Vad är nytt i version 6.20.2354:
Version 6.20.2354:
- PDF till text, PDF till CSV, PDF För att förbättra XML-funktionerna
- Ny extrahera video, extrahera ljudexempel
- CSV- och XML-extraktorer förbättrade stöd för tabeller med tomma kolumner inuti
- ny MultimediaExtractor för att extrahera video och ljud från PDF
- ny egenskap PageDataCaching
- nytt "MemoryCareProcessingOfHugeFiles" exempel
- Fast null undantag när du försöker skicka bort redan borttagna sidor
- XLSExtractor: förbättrar stöd för teckensnitt
- SkipInvisibleText hoppar nu klippt text (som inte är synligt)
- Utmatning av textutmatning förbättras
- XFDF Extractor: lagt till stöd för kryssrutor
- Utmatning av bilder förbättras för att stödja fler underformat
- Unicode texthantering förbättras
Vad är nytt i version 6.11.2149:
Version 6.11.2149:
- Batchprocessprover uppdaterade för att visa användningen av Reset () -metoden
- C ++-källkodsprov som lagts till för Pages Extraction
- DocumentMerger lägger till Merge2 (inputfile1, inputfile2, outputfile) metod för att slå samman 2 filer
- XLS Extractor mindre buggfixar
- PDF Multitool tillåter nu att aktivera / inaktivera text, bild, vektorlager, lägger till avancerade inställningar för textutvinning
- XML, CSV, tabellutvinning förbättrar stöd för tabeller med emtpryceller i kolumnerna
- .ExtractShadowLikeText egenskap förbättrad: bättre filtrering för skuggliknande text
Vad är nytt i version 6.10.2136:
Version 6.10.2136:
- PDF till XML, PDF till CSV, PDF till textfunktion förbättras
- PDF till XLS kommandoradspröva läggs till (baserat på vbscript)
- PDF till HTML SDK lägger till ny .DetectHyperLinks-egenskap (SAND som standard) för att aktivera / inaktivera automatisk upptäckt av länkar i texten
- Ny SearchablePDFMaker (tillgänglig för PRO-licenser) för att konvertera PDF till sökbara PDF-filer
- Nya egenskaper i extractor: ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, ConsiderVerticalBorders i CFG-filer
- upptäckning av header kolumner (när AutoAlighHeaderToColumns = true) förbättras
- .DetectLinesInsteadOfParagraphs ersätts med nya .LineGroupingMode för att styra hur linjer sammanfogas till stycken
- VIKTIGT! PDF Till XML fixar lång tidsproblem med inkorrekt Y-koordinat för textobjekt (pekade åt vänster till vänster istället för till vänster)
- .TableXMinIntersectionRequiredInPercents och .TableYMinIntersectionRequiredInPercents egenskaper tillagda
- C ++-källkodsprov läggs till
- XML Extractor fixar saknade tomma kolumner i PreserveFormatting = sant läge
- mindre korrigeringar i färger i vissa PDF-filer
- stöd för flera OCR-språk som lagts till
- PDF Multitool GUI: lägger till Kopiera till Clipboard-knappen till TXT, CSV, XML och raster renderer dialoger
- XLSExtractor: lägger till egenskapen PageToWorksheet för att aktivera / inaktivera generering av separata kalkylblad per sida
- ny .TextEncodingCodePage-egenskap
- PDFViewerControl: lägger till ValidateContextMenu så att användaren kan lägga till anpassade objekt i kontextmenyn
- PDF Viewer-kontroll: lägger till egenskaper ShowTextObjects, ShowImageObjects, ShowVectorObjects
- XMLExtractor lägger nu till attributet "OCRConfidence" för erkänd text
- PDF / En kontrollfunktionalitet (i beta)
- förbättrar kontroller och textkontroll och anpassning enligt originallayouten. Problemet orsakades av övergången av Y-koordinater i kontroller medan man analyserade: det var felaktigt. Det rätta sättet är att shif ...
- XML Extractor uppdaterad: producerar nu CONTROL-tagg för kryssrutor och textfält
- ändras med hjälp av aktuell katalog till tempkatalogen
- kryssrutor, radioboxar, editboxes, comboboxer stöds bättre
- tillåter nu partiella förtroendeuppringare
Vad är nytt i version 5.80.1781:
Version 5.80.1781:
- PDF till XML, PDF till CSV, PDF till Text-funktionalitet uppdaterad
- OCRMode ger nu 9 lägen
- .DetectLineInsteadOfParagraph fungerar nu mycket bättre. Ställ den på False för att fånga multilin text i tabellceller!
- PDF-kontroller förbättras
- FDF och XFDF data extraktion
Vad är nytt i version 5.10.1747:
Version 5.10.1747:
- PDF till XML, PDF till CSV, PDF till Textfunktioner förbättras
- Stödjer nu textutdragning från textkontroll
- XML-extraktor lägger nu till typsnitt, storlek, namn, textkoordinater i taggar
- ASP.NET-prov för OCR-användning läggs till
- Ny egendom OCRLanguageDataFolder för att ange platsen för "tessdata" -mappen
- förbättrat stöd för PDF-filer
- förbättrar stöd för roterad text
- uppdaterade källkodsprover
- uppdaterad dokumentation
- mindre förbättringar och korrigeringar
Vad är nytt i version 5.00.1626:
Version 5.00.1626:
- OCR (text från bilder) läggs till: nu kan du extrahera text från inbäddade bilder och reparera skadad text
- Problemet fixat med CSV och XML-extraktorn saknar de senaste kolumnerna med vissa inställningar
- förbättrat stöd för skadade PDF-filer
- Multilinsökning med söktext med ord matchande lägen stöds nu
- kan nu söka efter text med bindestreck och på olika rader: se nya källkodsprov Hitta text med hyphens
- ny egenskap .RTLTextAutoDetectionEnabled (fel som standard) för att automatiskt identifiera RTL-språk
- PDF Viewer GUI-demo förbättras
- mindre förbättringar och korrigeringar
Krav :
.NET Framework 2.0 eller högre
Begränsningar :
Nagskärm, vattenstämpel på utgången
Kommentarer hittades inte